26 research outputs found

    Automatikusan generált online szótárak

    Get PDF

    A szótárkészítés támogatása párhuzamos korpuszokon végzett szóillesztéssel

    Get PDF
    Cikkünkben egy kétnyelv szótárak készítésének gépi támogatására irányuló módszert ismertetünk. A javasolt megközelítés alapja a párhuzamos korpuszokon végzett automatikus szóillesztés. A korpuszvezérelt megközelítés, ezen belül különösen a párhuzamos korpusz használata több okból is hasznosnak bizonyult a lexikográfia számára. Ezek közül a legfontosabb, hogy – megfelel méret reprezentatív korpusz használatával – a javasolt megközelítés garantálja, hogy a legrelevánsabb fordítások fognak szerepelni a szótárban. További elnyt jelent, hogy az összes korpuszbeli példamondat könnyedén hozzáférhet, így a poliszém jelentések közül nagy mennyiség természetes adat alapján választhatjuk ki a legmegfelelbbet. A két fenti tulajdonság különösen alkalmassá teszi az általunk javasolt módszert aktív szótárak elállítására

    Az EFNILEX első szakasza

    Get PDF

    Automatikusan generált online szótárak : az EFNILEX projekt eredményei

    Get PDF
    Az előadás összefoglalja a 2008-ban kezdődő EFNILEX lexikográfiai projekt munkálatait, különös tekintettel a 2012-ben elért eredményekre. A projekt célja annak a vizsgálata volt, hogy a nyelvtechnológiai eszközök és eljárások mennyiben alkalmasak a kétnyelvű szótárak előállításának támogatására. Ennek elsősorban a kevéssé használt nyelvek esetében van jelentősége, hiszen ezeket a szótárakat a kereskedelmi kiadók nem tartják piacképesnek, így az elkészítésükbe sem invesztálnak jelentősen

    Igék szemantikai klaszterezése bővítménykereteik alapján

    Get PDF
    A bemutatott kísérlet célja a magyar igék bővítménykereteik alapján történő szemantikai csoportosítása nem felügyelt tanulási módszerrel. A bővítménykereteket a Szeged Treebankből nyertük ki. Az igéket hierarchikus klaszterezési eljárással csoportosítottuk. A cikkben bemutatjuk az eljárást, az eredményeket, valamint kitérünk a szemantikai osztályok kiértékelésének nehézségeire, és javaslatot teszünk egy új értékelési módszerre

    A vonzatok és a szabad határozók elkülönítéséről

    Get PDF
    Jelen írásban célunk a lexikalista nyelvelméletek vonzatokra és szabad határozókra vonatkozó közös elĘfeltevéseinek vizsgálata. Ennek kapcsán azt állítjuk, hogy bár egy konkrét nyelvtan mindig a lexikon elemeibĘl építkezik, a szabad határozók és a vonzatok elkülönítése során célszerĦbb a szabad határozókból kiindulni. Ennek egyik oka, hogy ha a vonzatokra mint igei argumentumok realizációira tekintünk, akkor – mivel az igei argumentumság közvetlenül nem tesztelhetĘ – szükség lenne pusztán formai vonzatkritériumokra is. A két különbözĘ típusú követelmény azonban egy bizonyos típusú összetevĘ esetén eltérĘ predikcióhoz vezet az összetevĘ grammatikai funkciójára vonatkozóan. Ez pedig azt valószínĦsíti, hogy a lexikalista nyelvelméletek által a vonzatokkal szemben támasztott összes követelmény nem tartható egyszerre. Ezek után az adjunktumok egy újfajta felfogását vázoljuk

    Többszavas kifejezések kezelése a párhuzamos korpuszokra épülő szótárkészítési módszertanban

    Get PDF
    Jelen cikk célja annak vizsgálata, hogy a párhuzamos korpuszokból fordítási ekvivalensek kinyerésére használt módszer kiterjeszthet-e többszavas kifejezésekre is. A kísérletben a többszavas kifejezéseket kizárólag igei szerkezetek alkották. Els lépésként a párhuzamos korpusz forrásnyelvi és célnyelvi oldalából külön-külön nyertük ki az igei szerkezeteket. A jelenlegi fázisban a kinyerés félig automatikus módon történt: elre meghatározott forrásnyelvi igékhez és ezek célnyelvi fordításaihoz tartozó igei szerkezeteket kerestünk, melyekbl kézzel válogattuk ki a céljainknak megfeleleket. A következ lépésben ezeket egytagú kifejezésekké vontuk össze a párhuzamos korpuszban. Az összevont igei szerkezetek már az illesztési algoritmus bemeneteként szolgálhattak. Eredményeink azt mutatják, hogy az alkalmazott módszer jól használható igei szerkezetek fordítási ekvivalenseinek detekciójára
    corecore